0
土地、勞動力、資本、技術(shù)之后的第五種生產(chǎn)要素是什么?數(shù)據(jù)。
數(shù)據(jù)的安全有序有效流動問題,學術(shù)界和業(yè)界“解法”眾多,要讓技術(shù)理論真正進入到應(yīng)用落地的進程絕非易事。
為此,雷鋒網(wǎng)《AI金融評論》率先推出了《金融聯(lián)邦學習公開課》系列,并與HKSAIR(香港人工智能與機器人學會)聯(lián)手打造了《AI金融-隱私計算與聯(lián)邦學習》系列公開課,十余位國內(nèi)聯(lián)邦學習與隱私計算頂尖專家做客線上講堂,就相關(guān)研究熱點與商業(yè)應(yīng)用展開最前沿的分享和討論。
近期,《AI金融評論》邀請到了華控清交CEO張旭東做客雷鋒網(wǎng)公開課,談?wù)勊壑械臄?shù)據(jù)隱私保護技術(shù),以及華控清交一系列工程化研究的探索和實踐。
以下為張旭東公開課全文,AI金融評論做了不改變原意的編輯:
數(shù)據(jù)是數(shù)字經(jīng)濟的關(guān)鍵生產(chǎn)要素。從農(nóng)業(yè)社會到工業(yè)社會再到信息時代,直到我們現(xiàn)在開始進入數(shù)字經(jīng)濟時代,每個社會發(fā)展階段都有一種生產(chǎn)要素是最重要的和最難替代的。
目前黨和國家對數(shù)據(jù)要素化的認識程度在不斷加深,從2014年開始,習主席談到信息日益成為重要的生產(chǎn)要素,到去年四中全會,包括在今年的6月1號,國務(wù)院關(guān)于海南自由貿(mào)易港建設(shè)的總體方案中,都提到了數(shù)據(jù)要素化,數(shù)據(jù)要流通、挖掘價值。

數(shù)字經(jīng)濟時代,數(shù)據(jù)是在人類生活和生產(chǎn)過程中,對自然資源和社會資源在分配和使用上進行優(yōu)化的決策依據(jù)。
首先,我們來看看作為生產(chǎn)要素的數(shù)據(jù),為什么要交易流通?
第一,生產(chǎn)要素的價格,是它參與社會化大分工的分配依據(jù)。國家講得很清楚,要健全數(shù)據(jù)等生產(chǎn)要素,由市場評價貢獻、按貢獻決定報酬的機制,其中就提到了市場化的定價。價格是報酬的決定因素,數(shù)據(jù)作為生產(chǎn)化要素的報酬,那么如何形成定價呢?
這就需要流通,需要由市場來進行,需要由供需來決定。
我們用一個模型算出來這個數(shù)據(jù)值多少錢,是不是它的價格?不是,因為沒有通過市場供需關(guān)系的檢驗,所以,數(shù)據(jù)的價格由市場決定,由市場供需決定,使數(shù)據(jù)成為生產(chǎn)要素的關(guān)鍵需要由市場供需決定,就需要流通。
那么,既然數(shù)據(jù)作為生產(chǎn)要素需要交易流通并進行定價,為什么現(xiàn)在為止還沒有大規(guī)模的數(shù)據(jù)流通,沒有大規(guī)模的數(shù)據(jù)要素市場?難在哪里?缺什么?
從數(shù)據(jù)特性來看,數(shù)據(jù)是一個很特殊的生產(chǎn)要素,其特征是復(fù)制成本極低,復(fù)制速度奇快,傳播速度也極快。數(shù)據(jù)一旦被看見,包括被人看見或者被機器看見,都可以被復(fù)制,而且是可以被無限制地復(fù)制。
在簡單的經(jīng)典經(jīng)濟學理論上,供需要有兩根曲線相交,才能形成價格。明文數(shù)據(jù)的特點,使得它的供應(yīng)和需求都是無限的,供應(yīng)和需求兩根線無法形成一個焦點,很難通過市場供需進行定價,并形成大規(guī)模的市場交易流通。
再者,數(shù)據(jù)還存在一些群體性和公眾性的泄露或濫用的問題,這些可能會影響整個群體甚至國家的利益。如果出了事,誰負責?獲得利益后,該怎么處理?權(quán)利應(yīng)該怎么主張?原始數(shù)據(jù)、二手數(shù)據(jù)、再生數(shù)據(jù)等,不同方又有什么樣不同的權(quán)益和責任?
這么多問題,目前要把它整盤解決,還需要很長的時間、需要實踐和探索。我認為沒有一個完美的答案——會有很多取舍,關(guān)鍵是取什么?舍什么?
從數(shù)據(jù)價值來看,我們可以把它分為信息價值和計算價值。
以波粒二象性打個比喻——數(shù)據(jù)有可以被展示或者被看見的具體信息,而另外一方面,數(shù)據(jù)雖然看不見,但是可以被用于計算得出結(jié)果,這就類似量子力學中的粒子和波。粒子是有形的,波是無形的,但是他們同樣傳播能量。
在目前大數(shù)據(jù)和人工智能的時代,我們也把數(shù)據(jù)比作新的能量——數(shù)據(jù)能,而數(shù)據(jù)的主要價值越來越多的體現(xiàn)在它的計算價值。

那么,數(shù)據(jù)交易流通的前提和形態(tài)是什么?
因為明文數(shù)據(jù)的特征和特性,無法進行大規(guī)模的交易和流通。所以必須把數(shù)據(jù)的具體信息和計算價值分開,把數(shù)據(jù)作為變成可用不可見,避免被看見后造成無限供應(yīng)和無限使用。
計算價值怎么辦?能不能對數(shù)據(jù)的計算價值進行限制,只有規(guī)定數(shù)據(jù)的價值,才能對數(shù)據(jù)的使用權(quán)進行定性、定量,形成有限的供應(yīng)和需求,才能讓這兩根線豎起來形成焦點,同時避免、防止數(shù)據(jù)被濫用,厘清數(shù)據(jù)的責、權(quán)、利。
如何能夠做到以上兩點,通過市場供需進行定價和大規(guī)模流通的是什么?既不是數(shù)據(jù)本身,也不是明文數(shù)據(jù),而是數(shù)據(jù)的特定使用權(quán)。
目前,大家談到數(shù)據(jù)時,就會談到數(shù)據(jù)確權(quán)和交易流通。這兒先拋出一個觀點,就是:過早、過嚴、過窄地定義和規(guī)定數(shù)據(jù)的所有權(quán),在法律上可能會制約數(shù)據(jù)產(chǎn)業(yè)和數(shù)據(jù)生態(tài)的發(fā)展。目前,要通過實踐積累、摸索經(jīng)驗,反復(fù)的試驗,才能夠把這件事做好。
數(shù)據(jù)確權(quán)的難處,只能點到為止。交易和流通需要生態(tài),其中更重要的是,需要數(shù)據(jù)和資本的結(jié)合,才能使數(shù)據(jù)的交易流通、要素化大規(guī)模發(fā)展。
現(xiàn)在,數(shù)據(jù)還不是法律和金融意義上的資產(chǎn)?!翱捎貌豢梢姟奔由弦?guī)定用途和規(guī)定用量,可以實現(xiàn)數(shù)據(jù)的歸屬權(quán)、使用權(quán)、收益權(quán)和處置權(quán)的分立,為數(shù)據(jù)真正成為資產(chǎn),成為生產(chǎn)要素奠定技術(shù)基礎(chǔ)。最后使它變成法律和金融意義上的資產(chǎn)的,不是技術(shù),而是法律法規(guī)對其進行保障。
在目前數(shù)據(jù)確權(quán)相關(guān)法律法規(guī)還不健全的情況下,是不是可以進行嘗試,使數(shù)據(jù)交易流通?可能性是有的。也只有這么做才能反過來為數(shù)據(jù)的確權(quán)真正提供有益的實踐和探索。
怎么做?利用數(shù)據(jù)的可用不可見和規(guī)定用途、用量的技術(shù)手段,把它的使用權(quán)和受益權(quán)抽取出來。只針對使用權(quán)和受益權(quán),在目前這個階段,已經(jīng)足夠讓數(shù)據(jù)進行先期的交易和流通,為后期的進一步的數(shù)據(jù)確權(quán)積累經(jīng)驗。
怎么才能做到可用不可見,又如何規(guī)定數(shù)據(jù)的用途用量?
數(shù)據(jù)可用不可見的基礎(chǔ)理論叫多方安全計算理論(MPC——multi party competition),由姚期智先生提出。安全是前提,沒有安全就沒有多方。
他通過兩篇論文,提出了百萬富翁問題:兩個百萬富翁碰到后,相互都不愿意告訴對方有多少錢,也沒有一個可信第三方,怎么把這個比較做出來?
姚期智先生在86年從數(shù)學上證明,凡是可以在明文上進行的技術(shù),都可以在密文上進行計算,而且得出同樣的結(jié)果?,F(xiàn)在多方安全計算成了密碼學的一個重要分支。多方安全計算理論屬于密碼學范疇,是經(jīng)過嚴密的數(shù)學論證的,它的安全假設(shè)是不信任硬件,不信任人。
在明文計算體制當中,數(shù)據(jù)存儲的加密技術(shù)、安全技術(shù)已經(jīng)很發(fā)達,就像洋蔥,里邊有個寶貝,一層一層包起來,裝進保險箱,再裝進地下室,然后把鑰匙全拿走。
在這種情況下,唯獨在它進入芯片進行計算之前,必須解碼、解密成明文,才能編譯成指令集,輸入計算機進行計算,得出的是明文的結(jié)果,然后趕緊再包藏起來,進行傳輸。而在它解密成明文進行編譯、計算的時候,從理論上和實踐上都是不安全的——它要么要相信硬件,要么相信軟件,要么相信人。
多方安全計算理論,可以使數(shù)據(jù)在密文上直接進行計算,所以它可以不相信硬件,可以不相信軟件。
舉個不一定恰當?shù)睦?,就好像去澡堂洗澡,在明文范疇?nèi),你穿著衣服,從頭到腳全副武裝進去洗澡,很安全,不知道你是誰,但是到了澡堂之前,你必須裸露后才能洗澡,洗完后趕緊用毛巾擦干,恢復(fù)原狀。
但是,在澡堂子里洗的過程安全嗎?澡堂子是誰造的?誰管的?你能相信硬件,相信軟件沒有后門,相信管理這些硬件軟件的人嗎?
所以,多方安全計算做的就是穿著衣服洗澡,當然耗費大一點,水要用的很多,但洗完了以后出來還是完全蓋住的。
在這個理論剛提出的八十年代,算力耗費之多,使得它只是在理論上成立,如今分布式計算、通訊科技的發(fā)展,則使它具備初步的實用性。
華控清交實現(xiàn)了基于多方安全計算,把多種基于明文的隱私計算技術(shù)(比如數(shù)據(jù)脫敏、差分隱私,聯(lián)邦學習、可信計算等等)融合在一起形成的隱私計算解決方案,解決的是計算的準確性、保密性和計算效率之間的優(yōu)化等關(guān)鍵問題。
那么,怎么從理論到實踐,做到讓數(shù)據(jù)可用不可見?
我們把加法、乘法和比較通過密碼學原理,從根本上用密文的形式替代了明文,重新把通用函數(shù)和機器學習深度學習的工具密文化,可以像在明文上編程一樣,做到可用不可見的底層邏輯。

同時,我們還綜合應(yīng)用了基于明文的隱私計算技術(shù),實現(xiàn)了明文和密文的混合計算,在不同的場景下可以完成隱私查詢、聯(lián)合建模等實際應(yīng)用。
如何實現(xiàn)的呢?拿電話來舉例——人看不見,聲音聽得見,比喻可用不可見。
我們的隱私計算服務(wù)就如同“交換機”,負責按照數(shù)據(jù)提供房和數(shù)據(jù)使用方之間的數(shù)據(jù)計算合約,調(diào)配算力執(zhí)行隱私計算,并把計算結(jié)果給到合約指定的結(jié)果計算方。它是數(shù)據(jù)共享與流通的計算控制站和算力調(diào)配中心,是隱私保護計算和高效算力的結(jié)合體。
數(shù)據(jù)接入節(jié)點就如同“電話機”,部署在數(shù)據(jù)端,把明文數(shù)據(jù)轉(zhuǎn)換成計算因子或?qū)⒚芪挠嬎憬Y(jié)果解算成明文。而計算因子本身不承載任何可以“看見”的具體信息,是數(shù)據(jù)計算價值的載體。這些理論是通過密碼學和數(shù)學嚴密論證的。
那么,數(shù)據(jù)程控交換機可以連接多臺電話機,疊加起來、組合起來的就是數(shù)據(jù)電網(wǎng),就如同國家對數(shù)據(jù)要素進行監(jiān)測管理和宏觀調(diào)控的神經(jīng)系統(tǒng)和基礎(chǔ)設(shè)置,助力數(shù)據(jù)要素化。
這種基于合約的隱私計算技術(shù),能夠有效打通社會化數(shù)據(jù)閉環(huán),使數(shù)據(jù)真正成為生產(chǎn)要素。

雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。